National Repository of Grey Literature 8 records found  Search took 0.01 seconds. 
End-to-End Speech Recognition for Low-Resource Languages
Sokolovskii, Vladislav ; Schwarz, Petr (referee) ; Karafiát, Martin (advisor)
Oblast automatického rozpoznávání řeči začala přijímat end-to-end řešení neuronové sítě pro vytváření rozpoznávačů řeči. Povaha datového hladu těchto typů systémů však umožňuje vytvářet rozpoznávače pouze pro jazyky s velkými zdroji, jako je angličtina, čínština nebo španělština. Ve scénářích s nízkými zdroji je třeba vyvinout některá řešení, která zmírní problém nedostatku dat. Jednou z nejúčinnějších technik je doladění předtrénovaného modelu. Problém se stávajícími přístupy ladění spočívá v tom, že sada tokenů cílového a zdrojového jazyka se obvykle liší. To je důvod, proč předchozí přístupy k učení vícejazyčného přenosu vyžadovaly změnu výstupní vrstvy nebo smíchání tokenů z různých jazyků ve výstupní vrstvě, případně použití univerzální sady tokenů anebo samostatné výstupní vrstvy pro každý jazyk. To je nežádoucí, jelikož sdílení napříč jazyky je v tomto případě latentní a neovladatelné ve výstupním prostoru, když jsou grafémy specifické pro daný jazyk disjunktní. Proto tato práce navrhuje mapování tokenů do společné sady před začátkem předtréninku. Stávající řešení spočívá v transliteraci zdrojového jazyka do cílového, novým přístupem je romanizace, kde je sada tokenů cílového jazyka romanizována tak, aby odpovídala anglické abecedě. Následně lze diakritiku z romanizovaných hypotéz obnovit pomocí dalšího modelu obnovy. To má výhodu ve zvýšení sdílení v prostoru výstupního grafému.
End-to-End Speech Recognition for Low-Resource Languages
Sokolovskii, Vladislav ; Schwarz, Petr (referee) ; Karafiát, Martin (advisor)
Oblast automatického rozpoznávání řeči začala přijímat end-to-end řešení neuronové sítě pro vytváření rozpoznávačů řeči. Povaha datového hladu těchto typů systémů však umožňuje vytvářet rozpoznávače pouze pro jazyky s velkými zdroji, jako je angličtina, čínština nebo španělština. Ve scénářích s nízkými zdroji je třeba vyvinout některá řešení, která zmírní problém nedostatku dat. Jednou z nejúčinnějších technik je doladění předtrénovaného modelu. Problém se stávajícími přístupy ladění spočívá v tom, že sada tokenů cílového a zdrojového jazyka se obvykle liší. To je důvod, proč předchozí přístupy k učení vícejazyčného přenosu vyžadovaly změnu výstupní vrstvy nebo smíchání tokenů z různých jazyků ve výstupní vrstvě, případně použití univerzální sady tokenů anebo samostatné výstupní vrstvy pro každý jazyk. To je nežádoucí, jelikož sdílení napříč jazyky je v tomto případě latentní a neovladatelné ve výstupním prostoru, když jsou grafémy specifické pro daný jazyk disjunktní. Proto tato práce navrhuje mapování tokenů do společné sady před začátkem předtréninku. Stávající řešení spočívá v transliteraci zdrojového jazyka do cílového, novým přístupem je romanizace, kde je sada tokenů cílového jazyka romanizována tak, aby odpovídala anglické abecedě. Následně lze diakritiku z romanizovaných hypotéz obnovit pomocí dalšího modelu obnovy. To má výhodu ve zvýšení sdílení v prostoru výstupního grafému.
Linguistic analysis of historical text by Augustin Mitis Kázání o povětří
Voráčková, Hana ; Šmejkalová, Martina (advisor) ; Palkosková, Olga (referee)
The topic of thesis Linguistic Analysis of Historical Text by Augustin Mitis Kázání o povětří is the linguistic analysis of historical text Kázanj O Powětřj, which comes from the year 1620 and his author was Augustin Mitis. Text is divided into two parts - theoretical and practical. In the theoretical part the orthography and language of humanistic era is described. Practical section is bringing results of analysis of linguistic layers: orthography, phonetics, morphology, word formation and syntax. During the creation of the thesis is used the qualitative textual analysis, which is supplemented by the quantitative statistical analysis. The supplement of this thesis contains additional research, which contains analysis of two pages of print Wýklad Modlitby Boží, which comes from the same printing house as analyzed text. In the chapter about orthography the way of print is described. In this print was used the Brethren՚s orthography. Analysis of phonetic changes shows that they are not common. The chapter about morphology is focusing on representation of word classes and grammatical categories of nouns and verbs. In the chapter about word formation the methods of word formation are described. The syntactic analysis is focused on the complex and compound sentences and the grammatical constituents. Analysis of...
Linguistic aspect of the selected old Czech literary text
Mohlesová, Lucie ; Šmejkalová, Martina (advisor) ; Palkosková, Olga (referee)
The topic of this thesis is the linguistic analysis of the Apollonius of Tyre novel contained in the Pinvicka collection, which comes from the second half of the 15th century. During the creation of the thesis is used especially the qualitative textual analysis, which is in the major part of the thesis supplemented by the quantitative statistical analysis. Opening parts of the thesis represent general information about the Pinvicka collection, in which is contained the analysed literary landmark, and about the literary landmark itself. Follows the detailed analysis of the orthography and of all linguistic layers, i.e. phonology, morphology, syntax and word formation. Every linguistic layer and the orthography are elaborated in a separate chapter. At the end of each chapter is the summary of the achieved results, which includes also charts and tables. In the chapter, which is devoted to the orthography, is primarily payd attention to the speech sounds, for which is typical disunited way of transcript. In the phonological part are treated phonic changes, which are realized in the text. The morphological part of the thesis is concerned with representation of word classes and particulary with grammatical cathegories of nouns and verbs. In the chapter, which treats syntactic plane, are analysed compound...
Transcription and linguistic analysis of chapter 13rd of the Prophet Daniel in the Mikulov's Bible
Jendelová, Alice ; Rejzek, Jiří (advisor) ; Dittmann, Robert (referee)
This thesis deals with the topic Transcription and Linguistic Analysis of Chapters 13 of the Prophet Daniel in the Mikulov's Bible. Its aim is to briefly summarize the history of Bible translation on the Czech territory. It also presents the text of the Mikulov's Bible, which has not yet been processed and its literary and historical classification. The work also includes transliteration and transcription of the text, including its comment. Furthermore, already dealing with linguistic analysis of the examined text in the terms of orthography, phonology, morphology and syntax. Key words Mikulov's bible, transliteration, transcription, linguistic analysis, orthography, phonology, morphology, syntax
A Comprehensive Study of The Dzikowian Manuscript Focusing on a Graphic, Language and Textual Analysis of the Czech Postil
Svobodová, Andrea ; Dittmann, Robert (advisor) ; Kosek, Pavel (referee) ; Komárek, Karel (referee)
Mgr. Andrea Svobodová Komplexní studium Rukopisu dzikovského se zam ením na grafickou, jazykovou a textovou analýzu eské sbírky kázání A Comprehensive Study of The Dzikowian Manuscript Focusing on a Graphic, Language and Textual Analysis of the Czech Postil Abstract The thesis submits a comprehensive philological analysis of the Dzikowian Manuscript, an insufficiently explored late medieval manuscript containing two postils, de tempore in Latin and de sanctis in Old Czech. The thesis aims to specify the place of this work in the context of medieval preaching, to critically review the previous research and to find new paths of research in evaluating this work. It is divided into three chapters, their common topic being attribution of both the postils on the grounds of codicological, content, and especially language features. Special emphasis is put on description of non-standard language phenomena, their interpretation being a key factor for transcription rules (one of the main results achieved apart from precising probable dating and localisation is a complete transcription of the Old Czech postil). The phenomena described enrich the existing inventory of deviations from the standard language and call for relating to other sources traditionally categorised as dialectal and thus for elaborating diachronic...
The Transliteration Problems of Russian Cyrillic in Graphic Czech System and Vice Versa
PITŘÍK, Jaroslav
The bachelor thesis concerns transliteration problems in graphic Czech and Russian system. Theoretical part focuses on rules, methods and recommendation for the transformation of Latin alphabet in Cyrillic and vice versa. Practical part is composed of four selective lists: list of Czech and Russian geographical names and list of eminent historical and present personages.
(Semi)automatic Computer-aided Transcription
Lehečka, Boris ; Voleková, Kateřina
The paper presents the tools Brus and Transkriptor which are applied in the course of the editing of transcribed versions of the Old Czech texts.

Interested in being notified about new results for this query?
Subscribe to the RSS feed.